[レポート]SNOWFLAKE WORLD TOUR TOKYO:KEYNOTE #SWTTokyo
さがらです。
2024年9月11日~2024年9月12日に、「SNOWFLAKE WORLD TOUR TOKYO」が開催されました。
本記事はセッション「KEYNOTE」のレポートブログとなります。
登壇者
東條社長からの挨拶
- 全世界で同様のイベントを開催している
- 事前のイベントご登録が5000名が超えている
- KEYNOTEの席は1000席用意しているが、満席
Snowflake DATA DRIVERS WINNER
- Snowflakeを使いのお客様で、先進的な取り組みを行っている企業を表彰する仕組み
- 受賞者は下記リンク先よりご確認ください
CEO:SRIDHAR氏からの挨拶
- 今回初めて東京に来た
- 数千ものお客様がデータ・アプリを共有している
- Enterprise AIの時代:AIデータクラウド
- 皆様の企業データを使いながら、構築
- AI駆動のデータプラットフォーム
- Copilot機能による最適化
- データパイプラインも簡素化される
- データを扱うすべての人にとってのCopilotとなる
- AIはすべての企業を強化し、新しいビジネスを生み出す
- 現在の課題
- 高まる複雑性
- コストの制御
- セキュリティとプライバシー
- Snowflakeでできること
- すべてのワークロードをシングルプラットフォームで
- 継続的なパフォーマンス改善
- 使用した分だけの従量課金
- Snowflake Horizonによるガバナンス
- 2400を超えるデータプロダクトがMarketplaceで提供されている
- AIデータクラウドのまとめ
- あらゆる二-ズ、あらゆるペルソナに対応
CCCMK社・三井住友カード社を交えた対談
- CCCMK社
- 2024年4月に、Vポイントが誕生
- Vポイントは会員数1.3億人の、日本最大のポイントサービス
- 三井住友カード社
- 日本でVISAカードを発行した会社
- 最近は「Olive」という金融全体のサービスを1アカウントで提供している
- Vポイントになったことで今後の取り組み
- 顧客価値を先立つように、両社のデータ統合を活用していきたい
- Snowflakeだからこそできたこと
- スピード:サービスローンチの1~2か月前にデータの仕組みなどが決まった。これは今までのやり方ではできなかった
- コスト:ひいき目にいっても、従来のコストの10分の1になっている。これまではデータ共有となるとEDIを構築しての運用コストが非常にかかっていたが、Snowflakeのデータシェアリングなどの仕組みを使うことでシンプルに構築できた
- セキュリティ:SMBCはAWS、CCCMKはAzure、であったが、それぞれの環境でセキュアな環境を作れた。両社でデータをすべて開示しているわけではない、個人を特定するようなデータは公開しないように制御している
- 今後の展望
- データを提供いただくお客様に支持されるサービスがあることが大前提。お客様に支持されるようなサービスを2社で作っていきたい
- エンドユーザーにとってポイント制度が統合して良かったと思ってもらえるように、注力していく
JERA社を交えた対談
- JERA社
- 東京電力と中部電力の燃料・火力部門を統合した企業
- 国内電力の3割強を発電している
- JERAゼロエミッション2050:2050年にCO2の排出量ゼロを目指すプロジェクト
- JERA社の取り組み
- 藤冨様はビジネスシステム、インフラ整備、システム運用の実行系を担当されている
- 2019年に全社のデジタル変革プロジェクトが立ち上がった
- DPP(Digita Power Plant):計画外のプラント停止、CO2削減と燃料費の削減など、発電所運営に関するデータを集めてAIで分析・予測・効率化を行うアプリケーションを構築
- EKA(Enterprise Knowledge Advisor):Emilyという、発電所運営ノウハウを学習したAIが膨大なナレッジから最適解を提案
- ボイラ型火力におけるアンモニア発電:水素とアンモニアを用いた発電。この取り組みには、デジタルの取り組みも必要。具体的には、バリューチェーンを形成するすべての事業者との協力が必要で、そのために垣根を超えたデータ連携が必要となる
- Snowflakeへの期待
- Polaris Catalogなどの仕組みに期待している
EVP:Christian氏によるSnowflakeの最新機能紹介
- 私からは、弊社が提供しているAIデータクラウドを実現するためのケイパビリティについて紹介
- AIデータクラウドに必要な要素
- セキュリティとガバナンス、コンピュート、データ、etc
- 非構造化データのサポート
- 画像、音声、データなど
- 何千というお客様が、すでにSnowflakeを使って非構造化データを処理している
- Document AI:PDFなどのドキュメントに対して、自然言語で問い合わせて構造化データに変換
- Icebergのサポート
- いろいろなクエリエンジンと対応したい、という要望を多くの顧客から頂いて、Icebergに対応した
- Apache Polaris:Icebergベースのカタログ。複数のクエリエンジンからの読み書きに対応。OSSのため、セルフホスティングも可能
- 様々なコンピュートの対応
- Snowpark Container Services:Dockerコンテナをホストして、様々なデータプログラムを使うことができる。AWSですでに一般提供、AzureとGoogle Cloudでも展開予定
- Snowflake Horizon
- Snowflake Horizonは、Snowflake内のガバナンスを実現する機能群
- 機能郡は下図を参照
- データパイプライン
- 取り込みでは、ストリーミングとバッチ、コネクタ、データ共有、様々な方法を提供
- 変換では、Snowparkを使うことでSparkのパイプラインからパフォーマンスもコストも向上している。Snowparkは全顧客の50%が利用している。Dynamic Tableも、23万以上のテーブル、3000以上の顧客、に使われている
- 観察では、Observeなどと連携したパイプラインの観察に対応
- アナリティクス
- 地理空間のデータのサポート
- OLTPとの同期(Hybrid Table、今後3か月以内に一般提供予定)
- Snowflake Copilot:SQLをどう改善すればいいか、などAIが提案してくれる
- 機械学習
- Snowflakeでは、機械学習のモデル構築のサイクルのすべてを提供している。Snowflake ML、特徴量ストア、モデルレジストリ
- SWIRE COCA-COLAでの事例:配達のルートを最適化している
- Snowflake Notebook:今後2か月以内に一般提供予定。まだ一般提供でないが、10%のお客様が使う予定があると伺っている
- LLM
- LLMの活用:BAYER社、Zoom社、Sigma社で行われている
- Cortex AI
- モデル:Snowflake Arcticを提供。GPT-4とかと競合しようとは考えていない。最も使われているのはMeta社のLlama
- チャット:LLMを用いた自然言語のエクスペリエンスを提供。Cortex AnalystとCortex Searchを提供
- Studio:ノーコードでのLLMを用いた開発を提供
デモ:通信会社で各問い合わせ内容を処理するためのSnowflakeのLLM機能群の紹介
-
たくさんの問い合わせを受けており、これを分類したい。これを手動で行うととても大変。ここで、SnowflakeのLLMを用いて、分類を行う
-
Llamaのモデルを使うとすぐに分類できるが、コストが高い(Llamaのモデル名を聞きそびれてしまいました…)
-
コスト削減のためにMistral-7bを用いると、分類結果が怪しい
- そこで、CortexのFine-tuningの出番
- Studioによる、ノーコードでGUIベースでぽちぽちしていくだけでFine-tuningができる
- Fine-tuningを行ったモデルを使うと、分類が正しく行われるようになった
- Cortex Analystを使って、自然言語で問い合わせできるようにする
- semantic modelを事前に定義しておくことで、正確な結果を返すことができるのがCortex Analyst
- Cortex Searchを使って、各顧客の契約書面などのドキュメントデータに対して自然言語で問い合わせができる。例えば、カスタマーサポートの分野で活用ができる
EVP:Christian氏によるSnowflakeの最新機能紹介:続き
- データプロダクト
- 30万を超えるアクティブなStreamlit開発者がSnowflakeユーザーにいる
- 多くの企業が、データアプリケーションを開発し、Marketplaceで公開している。日本企業だと、RAKUDEJI社、NTTデータ社、truestar社が提供している
- Aladin社のアセット管理、Tenable社のサイバーセキュリティ、BlueYonder社のサプライチェーン機能、多くの企業がSnowflakeでアプリケーションを開発し提供している
- 最後に
- 多くのお客様に効率よく安価に使用してもらえるための、魅力的な機能を今後も提供していく
最後に
SRIDHAR氏の日本での初登壇、多くの方が知っているであろう日本企業でのSnowflakeの活用状況、毎年来日して頂きわかりやすく各機能の紹介をしてくれるChristian氏、KT氏による最新機能のわかりやすいデモ、充実したKEYNOTEでした!!